AI资讯新闻榜单内容搜索-Long-horiz

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Long-horiz
开源RL框架Verlog来了,专为LLM智能体打造,400回合不成问题

开源RL框架Verlog来了,专为LLM智能体打造,400回合不成问题

开源RL框架Verlog来了,专为LLM智能体打造,400回合不成问题

具体而言,Verlog 是一个多轮强化学习框架,专为具有高度可变回合(episode)长度的长时程(long-horizon) LLM-Agent 任务而设计。它在继承 VeRL 和 BALROG 的基础上,并遵循 pytorch-a2c-ppo-acktr-gail 的成熟设计原则,引入了一系列专门优化手段,从而在任务跨度从短暂交互到数百回合时,依然能够实现稳定而高效的训练。

来自主题: AI技术研报
7558 点击    2025-10-09 11:16
Vibe Agent: Token成本直降90%,会对话就能创造专属本地Agent

Vibe Agent: Token成本直降90%,会对话就能创造专属本地Agent

Vibe Agent: Token成本直降90%,会对话就能创造专属本地Agent

刚刚,Local AI 领域的 Libra 团队发布了一段最新技术演示视频,展示了用户通过自然语言交互直接生成 Agent,并利用本地消费级算力支持 Agent 进行长程 (Long-Horizon) 推理,最终完成复杂任务。

来自主题: AI资讯
8907 点击    2025-04-02 15:43